期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于句式元学习的Twitter分类
闫雷鸣, 严璐绮, 王超智, 贺嘉会, 吴宏煜
北京大学学报自然科学版    2019, 55 (1): 98-104.   DOI: 10.13209/j.0479-8023.2018.054
摘要847)   HTML    PDF(pc) (1927KB)(223)    收藏

针对多类别的社交媒体短文本分类准确率较低问题, 提出一种学习多种句式的元学习方法, 用于改善Twitter文本分类性能。将Twitter文本聚类为多种句式, 各句式结合原类标签, 成为多样化的新类别, 从而原分类问题转化为较多类别的few-shot学习问题, 并通过训练深层网络来学习句式原型编码。用多个三分类Twitter数据来检验所提Meta-CNN方法 , 结果显示, 该方法的学习策略简单有效, 即便在样本数量不多的情况下, 与传统机器学习分类器和部分深度学习分类方法相比, Meta-CNN仍能获得较好的分类准确率和较高的F1值。

相关文章 | 多维度评价 | 评论0
2. 生化反应动力学校对过程中的内部噪声
王超, 王宏利
北京大学学报(自然科学版)    2015, 51 (6): 983-988.   DOI: 10.13209/j.0479-8023.2015.085
摘要986)      PDF(pc) (1287KB)(749)    收藏

从随机过程的角度, 对生物校对动力学过程进行了理论和数值分析。通过建立主方程, 对2步和3步中间过程的动力学校对随机动力学性质进行描述, 运用线性噪音近似的方法求得平衡态噪音的解析解, 并通过数值模拟的方法讨论噪音与参数间的关系。结果表明, 噪音随中间反应的进行而扩散和放大, 同时反应速率参数对噪音强度的大小也有显著影响。

相关文章 | 多维度评价 | 评论0
3. 基于双语合成语义的翻译相似度模型
王超超,熊德意,张民
北京大学学报(自然科学版)   
摘要758)      PDF(pc) (511KB)(384)    收藏
提出基于双语合成语义的翻译相似度模型, 通过在翻译过程中引入双语语义相似度特征提高翻译性能。首先利用分布式方法分别在源端和目标端获取短语的单语合成语义向量, 然后利用神经网络将它们映射到同一语义空间, 获得双语合成语义向量。在该语义空间, 计算源语言短语和对应的目标语言短语之间基于合成语义向量的翻译相似度, 将其作为一个新特征加入解码器。在汉英翻译NIST06和NIST08测试数据集上, 相较于基准系统, 基于双语合成语义的翻译相似度模型获得0.56和0.42 BLEU值的显著性提高。
相关文章 | 多维度评价 | 评论0
4. SARS冠状病毒的起源和进化初探
佘振苏,杨铸,欧阳正清,朱怀球,王超,尹建鑫
北京大学学报(自然科学版)   
摘要1100)      收藏
发展了一种研究基因序列进化的随机替代模型,根据一组从某个最近共同祖先演化而来的若干序列,可以预测此共同祖先序列,并计算随机替代概率矩阵,确定了从祖先序列的各个碱基到进化序列的各个碱基之间的替代概率。将这一模型应用于分析包括SARS冠状病毒在内的4种冠状病毒全基因组的演化规律,确定了在若干较保守的编码蛋白基因序列中同义替代位点的最近共同祖先序列以及分歧进化后的累计同义替代数目。结果表明,SARS病毒和其他几种已知的冠状病毒具有相当的进化历程,但存在不同的进化途径,支持了SARS病毒在造成此次大规模感染人体之前已经历了较长的进化历程的猜测。
相关文章 | 多维度评价 | 评论0